確率入門：経験的実験の力

宇宙に存在する原子数を上回る状態を持つ極めて複雑なゲームの勝率をどう求めればよいでしょうか？解析的な数学が手に負えなくなるとき、私たちはコンピュータの実験室に頼ります。 シミュレーション：これは実験を通じて確率を経験的に求める手法であり、理論的な確率と現実世界への応用との橋渡しとして機能します。

実験の構造

すべてのシミュレーションの核心には確率過程の再現があります。閉形式の式を解くのではなく、繰り返しの試行によってシステムの挙動をシミュレートします。これらの物理的な結果を数学的データに変換するために、私たちは 指標変数を使用します。

結果の定義

結果を数量化するために、イベントの成功または失敗を捉える確率変数を定義します。例えばサイコロゲームでは：

$$X = \begin{cases} 1 & \text{サイコロの合計が6の場合} \\ 0 & \text{それ以外の場合} \end{cases}$$

期待値は確率として

スリーブルのようなより複雑なゲームでは、$i$ 番目の試行の結果を $X_i$ と定義します：

$$X_i = \begin{cases} 1 & \text{$i$ 番目のゲームで勝利した場合} \\ 0 & \text{それ以外の場合} \end{cases}$$

重要なのは、期待値 $E[X_i] = P\{\text{スリーブルでの勝利}\}$ となることです。

理論的収束

なぜこれでうまくいくのでしょうか？シミュレーションの有効性は 大数の強法則（SLLN）に依存しています。私たちの推定器は標本平均として定義されます：

$$\sum_{i=1}^n \frac{X_i}{n} = \frac{\text{勝利ゲーム数}}{\text{プレイゲーム数}}$$

これは不偏推定器です。大数の強法則により、$\sum_{i=1}^n \frac{X_i}{n}$ は確率1で、$n \to \infty$ のときに $P\{\text{スリーブルでの勝利}\}$ に収束することがわかっています。

例：スリーブルのパラドックス

非常に複雑なスリーブルゲームの正確な勝率を計算することを想像してください。デッキの状態数が膨大であるため、解析的な組み合わせ論はほぼ不可能です。代わりに、固定戦略を使ってコンピュータに $n = 1,000,000$ 回のゲームをプレイさせます。各ゲームの $X_i$ を追跡することで、勝利の割合が得られ、従来の数え上げ法では得られない高精度な勝率推定が可能になります。

🎯 核心原則

シミュレーションは確率問題を統計的推定問題に変換します。SLLNを活用することで、数学的非可解性を計算による繰り返しで置き換えます。

質問 1

シミュレーションの文脈において、指標変数 $X_i$ の主な役割は何ですか？

乱数生成器のシードとして機能する

定性的な「勝ち」または「負け」の結果を数値（1 または 0）にマッピングする

標本サイズの分散を計算する

収束に必要な試行回数 $n$ を決定する

質問 2

どの数学的法則が、$n$ が非常に大きくなるにつれて、私たちのシミュレーション推定値が真の確率に近づくことを保証していますか？

中心極限定理

ベイズの定理

大数の強法則

全確率の法則

質問 3

スリーブルのゲームを10,000回シミュレートし、そのうち1,200回勝利した場合、$E[X_i]$ の推定値はどれですか？

0.12

1,200

0.88

初期値なしでは決定できない

質問 4

なぜ複雑なシステムに対して、シミュレーションは閉形式の解析的解よりも好まれるのですか？

シミュレーションは $n$ に関係なく常に100%正確である

解析的解は高次元状態空間では数学的に扱いにくいことがある

シミュレーションには乱数が必要ない

解析的解は離散変数にしか適用できない

質問 5

定義によると、シミュレーションとは何ですか？

極限を使って微分方程式を解く方法

実験を通じて確率を経験的に決定する方法

素数のみを生成するプロセス

微積分における不動点反復の研究

挑戦：アルゴリズムの効率性と近似

シミュレーションのメカニズム

収束理論から実装への移行には、データをどのように生成し、連続的な数学にどのように適用するかを理解することが必要です。

10.1

以下のアルゴリズムを分析してください：アルゴリズムは $1, \dots, n$ のランダムな順列を生成します。標準的な方法よりも速いのは、最後までどの位置も固定されないためです。$P(i)$ が位置 $i$ の要素を表すとき、このアルゴリズムの『公平性』はどのように維持されているでしょうか？

インストラクターの解答：
標準的なアルゴリズムでは、要素が最終インデックスに交換されると固定されます。この代替バージョンでは、通常、各位置 $i$ が、全体集合 $\{1, \dots, n\}$ から選ばれたランダムな位置 $j$ と交換する単一パスを実行します。流れはわずかに異なりますが、公平性（一様性）は維持されています。なぜなら、アルゴリズムには $n^n$ の可能な経路があり、それらは $n!$ 個の順列にマッピングされるため、各順列が結果として等しく確率で出現するようになっています。鍵となるのは、任意の要素が任意の特定の位置に到達する確率が常に $1/n$ のまま残ることです。

10.12

任意の関数 $k(x)$ について、乱数を使って $\int_0^1 k(x) \, dx$ を近似する方法を説明してください。

インストラクターの解答：
$(0, 1)$ 上の均一な確率変数 $U$ を考えます。期待値 $E[k(U)]$ は $\int_0^1 k(x) f_U(x) dx$ として定義されます。確率密度関数 $f_U(x) = 1$ が $x \in (0,1)$ で成り立つため、$E[k(U)] = \int_0^1 k(x) dx$ となります。

シミュレーションで積分を近似するには：
1. $Unif(0,1)$ から $n$ 個の独立した乱数 $U_1, U_2, \dots, U_n$ を生成します。
2. これらの点で関数を評価し、$k(U_1), k(U_2), \dots, k(U_n)$ を得ます。
3. 標本平均を計算します：$\frac{1}{n} \sum_{i=1}^n k(U_i)$。大数の強法則により、この平均は $n \to \infty$ のときに積分に収束します。